智能论文笔记

Two-step reinforcement learning for model-free redesign of nonlinear optimal regulator

Mei Minami , Yuka Masumoto , Yoshihiro Okawa , Tomotake Sasaki , Yutaka Hori

分类：机器学习

2021-03-05

在许多实际控制应用中，由于植物特征的变化，闭环系统的性能水平随着时间而变化。因此，在不经过系统建模过程的情况下，非常需要重新设计控制器，这对于闭环系统通常很难。强化学习（RL）是一种有前途的方法之一，仅基于闭环系统的测量，可以为非线性动力学系统提供最佳控制器的无模型重新设计。但是，RL的学习过程需要使用可能会在植物上累积磨损的控制系统不良的系统进行大量试验实验。为了克服这一限制，我们提出了一种无模型的两步设计方法，该方法在未知非线性系统的最佳调节器重新设计问题中提高了RL的瞬态学习性能。具体而言，我们首先设计了一种线性控制定律，该法律以无模型的方式达到一定程度的控制性能，然后通过并行使用设计的线性控制法来训练非线性最佳控制法。我们引入了一种线性控制定律设计的离线RL算法，并理论上保证了其在轻度假设下与LQR控制器的收敛性。数值模拟表明，所提出的方法可以提高RL的超参数调整中的瞬态学习性能和效率。

translated by 谷歌翻译

Neural Density-Distance Fields

Itsuki Ueda , Yoshihiro Fukuhara , Hirokatsu Kataoka , Hiroaki Aizawa , Hidehiko Shishido , Itaru Kitahara

分类：计算机视觉

2022-07-29

神经领域对3D视觉任务的成功现在是无可争议的。遵循这种趋势，已经提出了几种旨在进行视觉定位的方法（例如，大满贯）使用神经场估算距离或密度场。但是，很难仅通过基于密度字段的方法（例如神经辐射场（NERF））实现较高的定位性能，因为它们在大多数空区域中不提供密度梯度。另一方面，基于距离场的方法，例如神经隐式表面（NEU）在物体表面形状中具有局限性。本文提出了神经密度距离场（NEDDF），这是一种新颖的3D表示，可相互约束距离和密度场。我们将距离场公式扩展到没有明确边界表面的形状，例如皮毛或烟雾，从而可以从距离场到密度场进行显式转换。通过显式转换实现的一致距离和密度字段使稳健性可以符合初始值和高质量的注册。此外，字段之间的一致性允许从稀疏点云中快速收敛。实验表明，NEDDF可以实现较高的定位性能，同时在新型视图合成中提供可比的结果。该代码可在https://github.com/ueda0319/neddf上找到。

translated by 谷歌翻译

Involuntary Stabilization in Discrete-Event Physical Human-Robot Interaction

Hisayoshi Muramatsu , Yoshihiro Itaguchi , Seiichiro Katsura

分类：机器人

2022-06-28

人类不仅将机器人用作工具，而且还用作与人类的交互协助和合作，从而形成了人类机器人的互动。在这些相互作用中，反馈回路会导致不稳定的力相互作用，在这种情况下，力量升级使人类面临危险。先前的研究已经分析了自愿相互作用的稳定性，但在相互作用中忽略了非自愿行为。与先前的研究相反，本研究考虑了非自愿行为：人类的力量繁殖偏见是离散事件的人类机器人相互作用。我们基于数学偏见模型得出了渐近稳定性条件，发现偏差稳定了远离隐式平衡点的人类隐式平衡点，并破坏了该点附近的点。偏置模型，与隐式平衡点的相互作用的收敛性以及该点周围的差异通过使用三种不同的身体部位在三种相互作用下进行的行为实验来验证：手指，手腕和脚。我们的结果表明，人类与他们的非自愿行为暗中确保了自己与机器人之间的稳定和紧密的关系。

translated by 谷歌翻译

Aggregated Multi-output Gaussian Processes with Knowledge Transfer Across Domains

Yusuke Tanaka , Toshiyuki Tanaka , Tomoharu Iwata , Takeshi Kurashima , Maya Okawa , Yasunori Akagi , Hiroyuki Toda

分类： (统计)机器学习 | 机器学习

2022-06-24

汇总数据通常出现在社会经济和公共安全等各个领域。汇总数据与点不关联，而与支持（例如，城市中的空间区域）相关联。由于支撑物可能取决于属性（例如贫困率和犯罪率），因此对此类数据进行建模并不直接。本文提供了一个多输出高斯流程（MOGP）模型，该模型使用各自粒度的多个聚合数据集侵入属性的功能。在提出的模型中，每个属性的函数被认为是建模为独立潜在GPS的线性混合的依赖GP。我们设计一个具有每个属性聚合过程的观察模型；该过程是GP在相应支持上的组成部分。我们还引入了混合权重的先验分布，该分布可以通过共享先验来跨域（例如城市）进行知识转移。在这种情况下，这是有利的，因为城市中的空间汇总数据集太粗糙而无法插值。提出的模型仍然可以通过利用其他城市中的聚合数据集来准确地预测属性。提出的模型的推断是基于变异贝叶的，它使人们能够使用来自多个域的聚合数据集学习模型参数。该实验表明，所提出的模型在改善现实世界数据集上的粗粒骨料数据的任务中胜过：北京的空气污染物的时间序列以及来自纽约市和芝加哥的各种空间数据集。

translated by 谷歌翻译

Gaussian Fourier Pyramid for Local Laplacian Filter

Yuto Sumiya , Tomoki Otsuka , Yoshihiro Maeda , Norishige Fukushima

分类：计算机视觉

2022-06-08

多尺度处理对于图像处理和计算机图形至关重要。光环是多尺度处理中的核心问题。通过扩展Laplacian金字塔以具有边缘保留特性，几种边缘保护分解可以解决局部拉普拉斯滤波（LLF）。它的处理成本很高；因此，提出了快速LLF的近似加速度，以线性插值多个拉普拉斯金字塔。本文通过傅立叶系列扩展进一步提高了精度，称为傅立叶LLF。我们的结果表明，对于相同数量的金字塔，傅立叶LLF具有更高的精度。此外，傅立叶LLF表现出用于内容自适应过滤的参数自适应性能。该代码可在以下网址获得：https：//norishigefukushima.github.io/gaussianfourierpyramid/。

translated by 谷歌翻译

Utilizing Resource-Rich Language Datasets for End-to-End Scene Text Recognition in Resource-Poor Languages

Shota Orihashi , Yoshihiro Yamazaki , Naoki Makishima , Mana Ihori , Akihiko Takashima , Tomohiro Tanaka , Ryo Masumura

分类：计算机视觉 | 机器学习

2021-11-24

本文提出了一种用于端到端现场文本识别的新颖培训方法。端到端的场景文本识别提供高识别精度，尤其是在使用基于变压器的编码器 - 解码器模型时。要培训高度准确的端到端模型，我们需要为目标语言准备一个大型图像到文本配对数据集。但是，很难收集这些数据，特别是对于资源差的语言。为了克服这种困难，我们所提出的方法利用富裕的大型数据集，以资源丰富的语言，如英语，培训资源差的编码器解码器模型。我们的主要思想是建立一个模型，其中编码器反映了多种语言的知识，而解码器专门从事资源差的语言。为此，所提出的方法通过使用组合资源贫乏语言数据集和资源丰富的语言数据集的多语言数据集来预先培训编码器，以学习用于场景文本识别的语言不变知识。所提出的方法还通过使用资源贫乏语言的数据集预先列举解码器，使解码器更适合资源较差的语言。使用小型公共数据集进行日本现场文本识别的实验证明了该方法的有效性。

translated by 谷歌翻译

Hierarchical Knowledge Distillation for Dialogue Sequence Labeling

Shota Orihashi , Yoshihiro Yamazaki , Naoki Makishima , Mana Ihori , Akihiko Takashima , Tomohiro Tanaka , Ryo Masumura

分类：自然语言处理 | 机器学习

2021-11-22

本文提出了一种用于对话序列标记的新型知识蒸馏方法。对话序列标签是监督的学习任务，估计目标对话文档中每个话语的标签，并且对于许多诸如对话法估计的许多应用是有用的。准确的标签通常通过分层结构化的大型模型来实现，这些大型模型组成的话语级和对话级网络，分别捕获话语内和话语之间的上下文。但是，由于其型号大小，因此无法在资源受限设备上部署此类模型。为了克服这种困难，我们专注于通过蒸馏了大型和高性能教师模型的知识来列举一个小型模型的知识蒸馏。我们的主要思想是蒸馏知识，同时保持教师模型捕获的复杂环境。为此，所提出的方法，等级知识蒸馏，通过蒸馏来列举小型模型，而不是通过培训模型在教师模型中培训的话语水平和对话级环境的知识模拟教师模型在每个级别的输出。对话法案估算和呼叫场景分割的实验证明了该方法的有效性。

translated by 谷歌翻译

Stroke-Based Scene Text Erasing Using Synthetic Data for Training

Zhengmi Tang , Tomo Miyazaki , Yoshihiro Sugaya , Shinichiro Omachi

分类：计算机视觉

2021-04-23

场景文本擦除，它在自然图像中替换了具有合理内容的文本区域，近年来在计算机视觉社区中造成了重大关注。场景文本删除中有两个潜在的子任务：文本检测和图像修复。两个子任务都需要相当多的数据来实现更好的性能;但是，缺乏大型现实世界场景文本删除数据集不允许现有方法实现其潜力。为了弥补缺乏成对的真实世界数据，我们在额外的增强后大大使用了合成文本，随后仅在改进的合成文本引擎生成的数据集上培训了我们的模型。我们所提出的网络包含一个笔划掩模预测模块和背景染色模块，可以从裁剪文本图像中提取文本笔划作为相对较小的孔，以维持更多的背景内容以获得更好的修复结果。该模型可以用边界框部分删除场景图像中的文本实例，或者使用现有场景文本检测器进行自动场景文本擦除。 SCUT-SYN，ICDAR2013和SCUT-ENSTEXT数据集的定性和定量评估的实验结果表明，即使在现实世界数据上培训，我们的方法也显着优于现有的最先进的方法。

translated by 谷歌翻译